我们研究了最近引入的最低最大优化框架的一种变体,其中最大玩具被限制以贪婪的方式更新其参数,直到达到一阶固定点为止。我们对此框架的平衡定义取决于最小玩家使用该方向来更新其参数的方向的提案分布。我们表明,鉴于一个平稳且有界的非Convex-Nonconcave目标函数,访问Min-player的更新的任何提案分布以及最大播放器的随机梯度甲骨文,我们的算法收敛于上述近似近似近似局部平衡,以众多的局部平衡。不取决于维度的迭代。我们的算法发现的平衡点取决于提议分布,在应用我们的算法来训练gans时,我们选择提案分布作为随机梯度的分布。我们从经验上评估了我们的算法,以挑战非凸孔测试功能和GAN培训中引起的损失功能。我们的算法在这些测试功能上收敛,并在用于训练gans时会在合成和现实世界中稳定训练,并避免模式崩溃
translated by 谷歌翻译
Indian e-commerce industry has evolved over the last decade and is expected to grow over the next few years. The focus has now shifted to turnaround time (TAT) due to the emergence of many third-party logistics providers and higher customer expectations. The key consideration for delivery providers is to balance their overall operating costs while meeting the promised TAT to their customers. E-commerce delivery partners operate through a network of facilities whose strategic locations help to run the operations efficiently. In this work, we identify the locations of hubs throughout the country and their corresponding mapping with the distribution centers. The objective is to minimize the total network costs with TAT adherence. We use Genetic Algorithm and leverage business constraints to reduce the solution search space and hence the solution time. The results indicate an improvement of 9.73% in TAT compliance compared with the current scenario.
translated by 谷歌翻译
Autonomous vehicles must often contend with conflicting planning requirements, e.g., safety and comfort could be at odds with each other if avoiding a collision calls for slamming the brakes. To resolve such conflicts, assigning importance ranking to rules (i.e., imposing a rule hierarchy) has been proposed, which, in turn, induces rankings on trajectories based on the importance of the rules they satisfy. On one hand, imposing rule hierarchies can enhance interpretability, but introduce combinatorial complexity to planning; while on the other hand, differentiable reward structures can be leveraged by modern gradient-based optimization tools, but are less interpretable and unintuitive to tune. In this paper, we present an approach to equivalently express rule hierarchies as differentiable reward structures amenable to modern gradient-based optimizers, thereby, achieving the best of both worlds. We achieve this by formulating rank-preserving reward functions that are monotonic in the rank of the trajectories induced by the rule hierarchy; i.e., higher ranked trajectories receive higher reward. Equipped with a rule hierarchy and its corresponding rank-preserving reward function, we develop a two-stage planner that can efficiently resolve conflicting planning requirements. We demonstrate that our approach can generate motion plans in ~7-10 Hz for various challenging road navigation and intersection negotiation scenarios.
translated by 谷歌翻译
无人驾驶飞机在当天变得越来越流行,对它们的申请越过科学和工业的界限,从航空摄影到包装交付再到灾难管理,从该技术中受益。但是在它们变得司空见惯之前,要解决的挑战要使它们可靠和安全。以下论文讨论了与无人驾驶飞机的精确着陆相关的挑战,包括传感和控制的方法及其在各种应用中的优点和缺点。
translated by 谷歌翻译
随着无人机技术的改进,从监视到航空摄影再到包装交付的这些多功能自动驾驶汽车,已经发现了越来越多的用途,并且这些应用都带来了独特的挑战。本文实施了一个这样一个挑战的解决方案:降落在移动目标上。此问题以前已经通过不同程度的成功解决了,但是大多数实施都集中在室内应用程序上。室外以风和照明等变量的形式提出了更大的挑战,室外无人机更重,更容易受到惯性效应的影响。我们的方法纯粹是基于视觉的,使用单眼摄像机和基准标记来定位无人机和PID控制,以跟随和降落在平台上。
translated by 谷歌翻译
我们生活在一个充满活力的世界中,事物一直在改变。给定两张同一场景的图像,能够自动检测它们的变化在各种域中具有实际应用。在本文中,我们解决了变更检测问题,目的是检测图像对的“对象级”变化,尽管其观点和照明差异有所不同。为此,我们做出以下四个贡献:(i)我们提出了一种可扩展的方法,用于通过利用现有的对象分割基准来获得大规模更改检测培训数据集; (ii)我们介绍了基于共同注意的新型架构,能够隐含地确定图像对之间的对应关系,并在边界框预测的形式中找到变化; (iii)我们贡献了四个评估数据集,这些数据集涵盖了各种域和转换,包括合成图像变化,3D场景的实际监视图像以及带有摄像头运动的合成3D场景; (iv)我们在这四个数据集上评估了我们的模型,并证明了零拍摄并超出训练转换概括。
translated by 谷歌翻译
目标变量的日志和平方根变换通常用于预测模型中,以预测未来的销售。这些转换通常会导致更好的性能模型。但是,他们还引入了系统的负面偏见(遗产不足)。在本文中,我们证明了这种偏见的存在,深入研究其根本原因,并引入了两种方法以纠正偏见。我们得出的结论是,提出的偏差校正方法提高了模型性能(最多可提高50%),并为将偏置校正纳入建模工作流程而提高。我们还尝试了“ Tweedie”成本功能家族,这些功能通过直接建模销售来规避转换偏见问题。我们得出的结论是,Tweedie回归在建模销售时迄今为止提供了最佳性能,使其成为使用变换的目标变量的强大替代方案。
translated by 谷歌翻译
有效理解动态发展的多种互动对于捕获社会系统中代理的潜在行为至关重要。通常要直接观察这些相互作用是一项挑战,因此对潜在相互作用进行建模对于实现复杂行为至关重要。动态神经关系推断(DNRI)的最新工作在每个步骤中都捕获了明确的互动相互作用。但是,在每个步骤中的预测都会导致嘈杂的相互作用,并且没有事后检查就缺乏内在的解释性。此外,它需要访问地面真理注释来分析难以获得的预测相互作用。本文介绍了Dider,发现了可解释的动态发展关系,这是一种具有内在解释性的通用端到端交互建模框架。 Dider通过将潜在相互作用预测的任务分解为亚相互作用预测和持续时间估计,发现了一个可解释的代理相互作用序列。通过在延长的时间持续时间内强加亚相互作用类型的一致性,提出的框架可以实现内在的解释性,而无需进行任何事后检查。我们在合成数据集和现实世界数据集上评估了Dider。实验结果表明,建模解剖和可解释的动态关系可改善轨迹预测任务的性能。
translated by 谷歌翻译
问答(QA)系统越来越多地部署在支持现实世界决策的应用程序中。但是,最新的模型依赖于深层神经网络,这些网络很难被人类解释。固有的可解释模型或事后解释性方法可以帮助用户理解模型如何达到其预测,并在成功的情况下增加对系统的信任。此外,研究人员可以利用这些见解来开发更准确和偏见的新方法。在本文中,我们介绍了Square V2(Square的新版本),以根据图形和基于图形的说明等方法进行比较模型提供解释性基础架构。尽管显着图对于检查每个输入令牌对模型预测的重要性很有用,但来自外部知识图的基于图的解释使用户能够验证模型预测背后的推理。此外,我们提供了多种对抗性攻击,以比较质量检查模型的鲁棒性。通过这些解释性方法和对抗性攻击,我们旨在简化对可信赖的质量检查模型的研究。 Square可在https://square.ukp-lab.de上找到。
translated by 谷歌翻译
在现代自治堆栈中,预测模块对于在其他移动代理的存在下计划动作至关重要。但是,预测模块的失败会误导下游规划师做出不安全的决定。确实,轨迹预测任务固有的高度不确定性可确保这种错误预测经常发生。由于需要提高自动驾驶汽车的安全而不受损害其性能的需求,我们开发了一个概率运行时监视器,该监视器检测到何时发生“有害”预测故障,即与任务相关的失败检测器。我们通过将轨迹预测错误传播到计划成本来推理其对AV的影响来实现这一目标。此外,我们的检测器还配备了假阳性和假阴性速率的性能度量,并允许进行无数据校准。在我们的实验中,我们将检测器与其他各种检测器进行了比较,发现我们的检测器在接收器操作员特征曲线下具有最高的面积。
translated by 谷歌翻译